home *** CD-ROM | disk | FTP | other *** search
/ Collection of Internet / Collection of Internet.iso / infosrvr / doc / www_talk.arc / 000003_timbl _Tue Oct 29 10:03:11 1991.msg < prev    next >
Internet Message Format  |  1992-11-30  |  5KB

  1. Return-Path: <timbl>
  2. Received: by  nxoc01.cern.ch  (NeXT-1.0 (From Sendmail 5.52)/NeXT-2.0)
  3.     id AA07413; Tue, 29 Oct 91 10:03:11 GMT+0100
  4. Date: Tue, 29 Oct 91 10:03:11 GMT+0100
  5. From: timbl (Tim Berners-Lee)
  6. Message-Id: <9110290903.AA07413@ nxoc01.cern.ch >
  7. Received: by NeXT Mailer (1.62)
  8. To: connolly@pixel.convex.com, www-talk
  9. Subject: Re: status. Re: X11 BROWSER for WWW 
  10.  
  11. Dan,
  12.  
  13. > I've made some tangible progress on the X11 browser, so I though 
  14.  
  15. > I'd let you know.
  16. > ...
  17. > This code is not in any shape to distribute, or even show anybody.
  18. > But it works, and it's pretty speedy. That's enough to encourage me  
  19. > to polish it off.
  20.  
  21. Sounds like great progress! The TCL sounds interesting -- where did  
  22. you get it? 
  23.  
  24.  
  25. > [If you wan't my stuff, you'll have to be C++ capable. I can't
  26. > think in C any more. :-]
  27.  
  28. Don't worry - we can handle C++, although for the line mode browser  
  29. we wanted portability into places where C++ could not reach. That's  
  30. why the common code (in WWW/Implementation) is all in C. Believe me,  
  31. after writing the NeXT browser in Objective-C it was a wrench to  
  32. conclude that it would have to be deobjectified.
  33.  
  34. > If you could round up some info on exactly what I can expect to see  
  35. > in an HTML file, and some idea of how you want it formatted [I have  
  36. > the HTML doc and the LineMode browser, but if you've got time to
  37. > give me a little more info...] I'll be ready to tackle that pretty  
  38. > soon.
  39.  
  40. You ask for info on exactly what you can expect to find in an HTML  
  41. file, but you've read the two HTML files about HTML.  What is missing  
  42. from there?
  43.  
  44. Here is some discussion about the tags -- where it's not in  
  45. http://info.cern.ch/hypertext/WWW/MarkUp/Tags.html I have updated  
  46. that document now.
  47.  
  48. Most of the tags are just style tags: this goes for the headings H1  
  49. to H6, the lists UL and OL with list elements LI, the glossary DL  
  50. with elements DT and DD.
  51.  
  52. <TITLE> ..<TITLE> is designed to be used for putting in the top  
  53. banner of a window, or using as the window  name. It also is what you  
  54. would use in a history list. It shouldn't be displayed in the text  
  55. itself, as usually there is a <H1> heading atteh top of the text  
  56. anyway. A difference is that thet title is designed to make sense out  
  57. of context, whereas the heading is within context. For example,
  58. a title might be "Formatting Characters for Printf -- C reference  
  59. manual" whereas the heading may just be "Formatting characters".
  60.  
  61. The base address tag is not used, nor is highlighting HP1 etc.
  62.  
  63. Anchors are used!  The REL attribute is NOT used.
  64.  
  65. <ISINDEX> is sent by servers to indicate that they will accept a  
  66. search given this document name plus keywords. It turns on a search  
  67. panel when the document is the main window.  An even better  
  68. implementation would have a keyword field at the bottom of the text  
  69. window if the document is a searchable index.  That would make the  
  70. document more self-contained as an item in the user's eyes, and  
  71. reduce screen clutter.
  72.  
  73. <NEXTID> can be ignored by browsers, only needed for editors.
  74.  
  75. <XMP> and <LISTING> are used to indicate inserted literal text.
  76. To make life easier for those writing documents (and because we don't  
  77. have entities in the code yet) they are special in that EVERYTHING is  
  78. litteral text until the closing tag - so one can use XMP for giving
  79. examples of HTML for example.  (We really need an escaping method -  
  80. the next parser will have simpl entities like "<." for "<".)
  81. Within XMP or LISTING, newlines are significant (and mean "new  
  82. line"!)
  83.  
  84. <PLAINTEXT> is used to indicate that the rest of the file is in fact
  85. just ASCII. It turns off SGML parsing completely. It's a fudge for
  86. the moment, until we have the document format negociation.
  87. ______________________________________
  88.  
  89.     Structure of documents:
  90.  
  91. In writing a new generic parser, I wondered whether your text object  
  92. will store the nested structure of a document. At the moment, the  
  93. document is a linear sequence of styles: you can't have lists within  
  94. lists, etc. Ideally, it would be able to handle this - although its  
  95. more difficult for a human writer to handle when formatting the  
  96. document. I would in fact prefer, instead of <H1>, <H2> etc for  
  97. headings [those come from the AAP DTD] to have a nestable  
  98. <SECTION>..</SECTION> element, and a generic <H>..</H> which at any  
  99. level within the sections would produce the required level of  
  100. heading.
  101.  
  102. For a browser, it is quite satisfactory to flatten the structure back  
  103. into a sequence of styles, but for an editor it isn't. Are you going  
  104. to go for editing capability?
  105.  
  106. Tim
  107.  
  108. PS: Shall I put you on the www-talk list?